apriori算法 python：使用Apriori算法挖掘高频项集的潜在关联

#apriori算法 python：使用Apriori算法挖掘高频项集的潜在关联| 来源: 网络整理| 查看: 265

apriori算法 python：使用Apriori算法挖掘高频项集的潜在关联作者：芒果雪泡 • 2023-03-10 13:37:10 • 阅读 5

Apriori算法是一种用于发现关联规则的算法，它可以帮助我们找出最受欢迎的项目组合。Apriori算法是一种基于概率的算法，它使用购买历史数据来发现最受欢迎的项目组合。

Apriori算法的工作原理如下：

1.计算每个项目的支持度，支持度是一个衡量项目流行程度的指标，它表示在所有交易中，该项目出现的概率。

2.计算每个项目对的支持度，支持度是一个衡量项目组合流行程度的指标，它表示在所有交易中，该项目组合出现的概率。

3.计算每个项目组合的置信度，置信度是一个衡量项目组合的可信度的指标，它表示在一个项目出现的情况下，另一个项目也出现的概率。

4.根据支持度和置信度，选择出具有最高置信度的项目组合。

下面是一个使用Python实现Apriori算法的示例代码：

from itertools import combinations

# 定义数据集

dataset = [['Milk', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'],

['Dill', 'Onion', 'Nutmeg', 'Kidney Beans', 'Eggs', 'Yogurt'],

['Milk', 'Apple', 'Kidney Beans', 'Eggs'],

['Milk', 'Unicorn', 'Corn', 'Kidney Beans', 'Yogurt'],

['Corn', 'Onion', 'Onion', 'Kidney Beans', 'Ice cream', 'Eggs']]

# 支持度阈值

min_support = 0.6

# 创建一个字典，用于存储项目及其出现的次数

item_count = {}

# 遍历数据集，计算每个项目出现的次数

for transaction in dataset:

for item in transaction:

if item not in item_count:

item_count[item] = 1

else:

本站系公益性非盈利分享网址，本文来自用户投稿，不代表码文网立场，如若转载，请注明出处

python apriori apr rio python-3.x 赞 (43)

【本文地址】

今日新闻